首页> 外文OA文献 >CloudScan - A configuration-free invoice analysis system using recurrent neural networks
【2h】

CloudScan - A configuration-free invoice analysis system using recurrent neural networks

机译:Cloudscan - 使用循环的免配置发票分析系统   神经网络

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。
获取外文期刊封面目录资料

摘要

We present CloudScan; an invoice analysis system that requires zeroconfiguration or upfront annotation. In contrast to previous work, CloudScandoes not rely on templates of invoice layout, instead it learns a single globalmodel of invoices that naturally generalizes to unseen invoice layouts. Themodel is trained using data automatically extracted from end-user providedfeedback. This automatic training data extraction removes the requirement forusers to annotate the data precisely. We describe a recurrent neural networkmodel that can capture long range context and compare it to a baseline logisticregression model corresponding to the current CloudScan production system. Wetrain and evaluate the system on 8 important fields using a dataset of 326,471invoices. The recurrent neural network and baseline model achieve 0.891 and0.887 average F1 scores respectively on seen invoice layouts. For the hardertask of unseen invoice layouts, the recurrent neural network model outperformsthe baseline with 0.840 average F1 compared to 0.788.
机译:我们介绍CloudScan;需要零配置或预先批注的发票分析系统。与以前的工作相比,CloudScan不依赖发票布局模板,而是学习一个发票全局模型,该模型自然地推广到看不见的发票布局。使用从最终用户提供的反馈中自动提取的数据来训练模型。这种自动训练数据提取消除了用户精确注释数据的要求。我们描述了一种可捕获远程上下文的递归神经网络模型,并将其与对应于当前CloudScan生产系统的基线logistic回归模型进行比较。使用326,471个发票的数据集在8个重要字段上对系统进行训练和评估。循环神经网络和基线模型在可见的发票布局上分别达到0.891和0.887的平均F1分数。对于看不见的发票布局的艰巨任务,循环神经网络模型以0.840的平均F1优于0.788的平均F1优于基线。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号